研究得出阴性结果?可能是主要结局定义不当!
当一个临床研究得到阴性结果时,研究者典型的第一反应是:什么出错了?治疗是否真的无效?是否还有一线希望?接下来该怎么做?
新英格兰医学杂志发表的一篇文章,列举了试验的主要结局为阴性时,应该考虑的问题[1]。
表1. 主要结局阴性时应当考虑的问题
上一期我们讨论了第2个问题: “试验的把握度是否不足?”接下来,我们来谈一下第3个问题。
一、主要结局的定义是否合理
采用复合终点,虽然增加了主要结局事件的数量,但并不一定增加统计效能(或把握度, Power)。
例如,PROactive试验[2]比较了吡格列酮(Pioglitazone)与安慰剂对合并大血管病变的2型糖尿病的疗效。该研究定义的主要结局包括:死亡、心肌梗死、卒中、急性冠状动脉综合征、血管内手术和下肢截肢。
试验结束后,吡格列酮组累计发生514个主要结局事件,安慰剂组发生572个主要结局事件(HR:0.90, 95% CI:0.80–1.02, P=0.095;图1),试验得到的是阴性结果。
但是,如果仅用死亡、心肌梗死或中风这3个更常规的结局事件作为复合结局,吡格列酮组累计发生301个结局事件,安慰剂组发生358个事件(HR:0.84, 95% CI:0.72–0.98, P =0.027。图2),就得到了吡格列酮组更优的阳性结果。因此,定义复合结局时,并不是组分越多越好,额外增加的组分可能会带来随机干扰,从而稀释真正的疗效,使结果变得没有统计学意义。
二、主要结局的定义是否准确
试验成功与否也可能取决于对结局的定义和判断方法。例如,CHAMPION PLATFORM试验[3]比较了P2Y12受体拮抗剂坎格雷洛(Cangrelor)是否能更有效地预防接受PCI(经皮冠状动脉介入术)患者的术后缺血性并发症。该试验定义的主要结局为48小时内死亡、心肌梗死或因缺血行血管重建,中期分析时,发现坎格雷洛组和氯吡格雷组患者结局事件的发生率分别为7.0%(1851/2654)和8.0%(210/2641),坎格雷洛并未显示出对主要终点有益(HR:0.87;95%CI:0.71-1.07;P=0.17),导致这项试验因无效而被提前终止。
然而,对于生物标志物阳性的急性冠脉综合征患者,围手术期心肌梗死的定义并不能有效地识别PCI后不久发生的心肌梗死;如果采用更加准确的心肌梗死定义,则有可能得到阳性结果[4]。
因此,在随后的CHAMPION PHOENIX试验[5]中,研究者更加谨慎的评估了生物标志物变化和临床事件,以便能够更准确的定义心肌梗死。本次试验将主要结局事件定义为48小时内的死亡、心肌梗死、支架内血栓形成或缺血导致的血管重建。结果表明,坎格雷洛组与氯吡格雷组的主要结局事件发生率分别为4.7%和5.9%。坎格雷洛组的主要结局事件发生率下降了22%(HR:0.78;95%CI:0.66-0.93;P = 0.005。图3),最终促成了美国与欧洲药品管理机构批准该药物的临床使用。
可见,临床研究在定义主要结局,尤其是复合结局时,选择合适的结局并且准确定义是至关重要的,一小点疏忽可能就会导致整个试验的失败。
参考文献:
1. N Engl J Med. 2016;375: 861-70.
2. Lancet. 2005;366: 1279-89.
3. N Engl J Med. 2009;361:2330-41.
4. Heart. 2013;99: 1282-7.
5. N Engl J Med. 2013;368: 1303-13.
精彩回顾
关注医咖会,用正确的姿势读文献
我们建了一个微信群,有临床研究设计或统计学方面的难题?快加小咖个人微信(xys2016ykf),拉你进群和其他小伙伴们一起交流学习。诚邀各位伙伴加入我们创作内容,请和小咖联系,和大家分享你喜爱的临床研究以及有用的研究方法学知识。
点击左下角“阅读原文”,看看医咖会既往推送了哪些研究设计或统计学文章。还可以到医咖会公众号下方的自定义菜单,点击“直接搜索”,查找你想了解的内容。